另辟蹊径!“废弃数据+机器学习” 解锁高纯化学品制备新方法!
废弃数据也能变“废”为宝!这是浙江大学杭州国际科创中心(简称科创中心)科研人员取得的最新研究成果。
近年来,机器学习被引入到材料科学研究中,能显著提高材料研发效率。但目前现有文献中报道的实验数据一致性不足、完整性不佳,难以满足机器学习训练的需求。想要基于机器学习来实现对材料实际性能的高精度预测仍然充满挑战。
近日,科创中心生物与分子智造研究院高纯化学品智造团队通过结合废弃实验数据和计算化学参数实现了对材料性能高精度预测的通用机器学习训练策略,巧妙地解决了这个难题。目前,相关研究成果已发表在《Matter》期刊上。
“废弃数据+机器学习”解锁新技术
“机器学习效果的关键在于实现对材料性能的高精度预测,而其预测精度在很大程度上取决于训练数据的质量。”论文第一作者、科创中心生物与分子智造研究院博士后胡建波说。高质量的数据从哪里寻找?高纯化学品智造团队竟然将目光投向了课题组在过往研究过程中废弃的实验数据,这些数据在别人眼中或许“一文不值”,但在团队眼中却是难得的宝贝,他们结合计算化学方法,经过一番巧妙的“翻译”,废弃数据“摇身一变”就成了可以供计算机学习的高质量数据,并可以用来构建机器学习预测模型,挖掘材料结构与性质间的关联性。
机器学习工作流示意图
除了 “训练”,团队还通过测试集对计算机的学习“成果”进行“考试”。结果表明,训练集和测试集的预测结果都与实验数据吻合良好,这也说明所构建的机器学习模型能够捕获特征描述符与吸附性能之间的相关性,且废弃数据的引入可以显著地提高机器学习预测精度。
基于机器学习所构建的高精度AI模型,团队首次实现了对阴离子柱撑超微孔材料乙炔、乙烯、二氧化碳实验吸附性能的高精度预测,并成功合成出两种兼具高选择性和高吸附容量的吸附分离材料,未来有望取代传统方式,在高纯化学品分离技术上实现突破性变革,而这一成果也充分展示了AI技术强大的材料挖掘性能。
机器学习辅助探索具有最佳吸附分离性能的
阴离子柱撑超微孔材料
交叉融合!多元化的学术共同体
“一个新的交叉学科方向的研究是需要滋养的,包括时间、精力、资金上的投入,科创中心正是这样的一个地方,鼓励创新、鼓励探索,为我们施展拳脚、开展科研工作搭建了更广阔的舞台”,胡建波说。2021年,他来到科创中心,围绕高纯化学品制备相关领域开启了博士后研究工作。
早在2019年,邢华斌教授团队就提出了用机器学习的智能化方式指导实验,这也推动了一个多元的团队构建。今天,在邢华斌教授和崔希利研究员的指导下,团队更是在科创中心发展壮大。“我们的团队中有来自化工化学、计算机、人工智能等各个领域的成员,各类学科都有机会在这里做大跨度的融合”,胡建波介绍道。
而这不仅是一个团队,更是一个学术共同体。“在技术角度,我们联合攻关,在研究维度,每一位成员都在各自的领域有充分的发展空间,大家能够更加独立、更具活力地发展。”
今天取得的这项成果更是团队一年多来齐心协力、矢志攻关的结果。每一次等待表征实验的周期都有3-7天,尽管有的时候等到实验结果并不理想,大家也并不气馁,而是选择在各自的研究阵地不断优化实验方案。
今年以来,高纯化学品智造团队硕果频出,系列突破性研究成果先后发表在了Nat. Commun. (2 篇)、Angew. Chem. Int. Ed. (1 篇)等国际权威期刊上。未来,他们还希望依托科创中心生物与分子智造研究院iChemFoundry自动化科学技术装置,坚持用化工领域所积累的丰富知识和经验,扎实推进机器学习的充分利用,不断攻克在交叉学科领域遇到的难题。
文字/图片:孔晓睿 胡建波
本文编辑:孔晓睿
推荐阅读
点“在看”,送我一朵小黄花呀